Modelos “directos” (proveedores principales)
Proveedor | Modelos representativos (2025) | Precio entrada USD / 1M tokens |
Precio salida USD / 1M tokens |
Contexto máx. | Modalidades | Fortalezas | Regla de pulgar (eficiencia) |
---|---|---|---|---|---|---|---|
OpenAI | GPT-5 GPT-5 mini / nano GPT-4o | desde $1.25 (GPT-5) · $0.25 (mini) | desde $10 (GPT-5) · $2.00 (mini) · $20 (4o) | hasta 400K (GPT-5) | Texto, imagen; (audio/video con 4o y Realtime) | Razonamiento y código de alto nivel; ecosistema maduro; herramientas integradas | Generalista premium: GPT-5 = alta calidad por $/salida moderado; 4o = mejor latencia/multimodal |
Google (Gemini) | Gemini 2.5 Pro Gemini 2.5 Flash / Flash-Lite | Pro: $1.25 (≤200k) / $2.50 (>200k) Flash: $0.30 · Flash-Lite: $0.10 |
Pro: $10 (≤200k) / $15 (>200k) Flash: $2.50 · Flash-Lite: $0.40 |
2M (Pro) · 1M (Flash) | Texto, imagen, audio, video; Live API | Ventanas gigantes y buen costo en Flash; “grounding” con Google Search | Volumen & contextos largos: Flash/Flash-Lite maximizan $/token; Pro para tareas complejas con 2M |
Anthropic | Claude Sonnet 4 Claude Haiku 3.5 | Sonnet 4: $3 · Haiku 3.5: $0.80 | Sonnet 4: $15 · Haiku 3.5: $4 | 200K (serie Claude 4) | Texto e imagen (entrada); texto (salida) | Baja alucinación, seguridad/guardrails; batch y prompt caching claros | Calidad/seguridad: Sonnet 4 rinde muy bien en tareas críticas; Haiku = costo mínimo |
Cohere | Command R+ Command R Aya Expanse | R+: $2.50 · R: $0.50 · Aya: $0.50 | R+: $10 · R: $1.50 · Aya: $1.50 | No publicado (varía por despliegue) | Texto; (visión/otras según modelo) | Enfoque enterprise, despliegues privados y compliance | Empresa: buena relación costo/seguridad; R+ compite en razonamiento a menor $ que Sonnet |
Plataformas agregadoras (multi-modelo)
Azure OpenAI / Azure AI Foundry
Catálogo con OpenAI (y otros como Mistral, xAI, Meta, Cohere). Precios por token similares a los del proveedor, con opciones de Data Zones, SLAs empresariales, y residencia de datos.
El precio exacto depende del modelo/sku y región; revisar tabla oficial de Azure.
AWS Bedrock
Acceso a Anthropic, Meta, Cohere, Mistral y más. Se cobra por token (según modelo) y opcionalmente por Flows ($0.035 por 1.000 transiciones de nodo). Excelente para integrarlo con stack AWS.
Los precios varían por modelo y por si usas Provisioned Throughput.
Cómo decidir (ultra-resumen)
Escenario | Recomendación rápida |
---|---|
Mejor calidad general / agentes y código | GPT-5 (OpenAI). Si tu app es intensiva en contexto multimodal en tiempo real, evalúa GPT-4o. |
Contextos gigantes al menor costo | Gemini 2.5 Flash (precio ultra bajo) o 2.5 Pro si necesitas 2M tokens. |
Riesgo regulatorio / guardrails estrictos | Claude Sonnet 4 por robustez y controles; batch y prompt caching reducen coste. |
Privacidad y despliegue corporativo | Cohere Command R+ o consumir vía Azure/Bedrock por residencia de datos/SLA. |
Glosario express
- Entrada/Salida: tokens que envías / que genera el modelo (se tarifican distinto).
- Contexto: tamaño de ventana; más contexto = prompts/documentos más largos sin truncar.
- Batch / cachés: modos o features que bajan 50% el costo o reducen precio de contexto repetido.